O Quadro Matemático
O objetivo central é encontrar um vetor $x \in \mathbb{R}^n$ tal que a combinação linear $Ax = x_1a_1 + \dots + x_na_n$ melhor aproxime $b$. Isso é frequentemente referido como a regressão de $b$ sobre os regressores (as colunas de $A$).
Focamos no vetor de resíduos $r = Ax - b$. Na prática, assumimos um sistema sobredeterminado onde $m > n$. Por quê? Porque quando $m = n$ e $A$ é não singular, o ponto ótimo é simplesmente $A^{-1}b$, resultando em erro zero — um caso trivial para otimização.
Variações Canônicas
Dependendo do "tipo" de erro que queremos penalizar, escolhemos diferentes normas:
A abordagem mais comum. Minimiza a soma dos quadrados dos resíduos: $\|Ax - b\|_2^2$. É sensível a grandes valores discrepantes, mas oferece uma solução analítica através das equações normais.
Minimiza o máximo absoluto $\max_i |r_i|$. É usado quando cada medição individual deve permanecer dentro de uma tolerância estrita. Pode ser resolvido por meio do seguinte Programa Linear (PL):
minimize $t$
sujeito a $-t\mathbf{1} \preceq Ax - b \preceq t\mathbf{1}$
Minimiza $\sum |r_i|$. Essa abordagem é robusta a valores discrepantes, pois não eleva ao quadrado os erros. Também pode ser resolvida por meio de um PL:
minimize $\mathbf{1}^T t$
sujeito a $-t \preceq Ax - b \preceq t$
Contexto de Estimação
Em muitas áreas da engenharia, assumimos que um estado verdadeiro $x$ é obscurecido por ruído: $y = Ax + v$. Nosso objetivo é encontrar uma estimativa $\hat{x} = \text{argmin}_z \|Az - y\|$. Ao escolher a norma, estamos efetivamente fazendo uma suposição sobre a distribuição estatística do ruído $v$.